排序方式: 共有93条查询结果,搜索用时 31 毫秒
11.
针对多核集群系统所表现出的新的性能特征,提出了面向多核集群系统消息传递应用程序的并行模拟模型并设计、实现了一个并行模拟器MCPSim(Multi-core Cluster Parallel Simulator),MCPSim在功能模型和性能模型上体现了片内核间、结点内片间以及结点间等三个层次上消息通信的特点,同时支持对应用的消息数量、通信量等的百分比分布的profiling功能,采用PRIMEJ、acobi3D、NPB IS以及HPL等Benchmark程序对MCPSim进行了测试,结果表明MCPSim性能预测的精度优于BigSim,同时能够广泛应用于针对多核集群系统消息传递应用程序的性能分析中。 相似文献
12.
针对SMP机群,探讨了分别利用单机优化、OpenMP与MPI从指令级、共享存储级与分布主存级三个层次上改善矩阵并行乘Fox算法性能的方法。并通过调用数学函数库与混合编程的方式,在深腾6800上进行了实验,取得了相当满意的数值效果。 相似文献
13.
分析了战时装备调配保障决策的特点,运用模糊聚类分析法对装备调配保障对象进行了分组和优先级排序,以此为基础,运用目标规划法构建了战时装备调配保障决策模型,最后,通过实例验证了模型的可行性和有效性. 相似文献
14.
借鉴自然界生态系统的典型特征,提出机器人生态圈概念。通过使集群机器人进行智能协同与复杂演化,涌现自我维持、自我复制与自我进化等生命特征,实现无人条件下的长期生存、繁衍与进化,并执行特定的任务。针对机器人生态圈典型任务场景的自主任务决策需求,分析不同机器学习任务决策方法的特点,建立机器人生态圈自主任务决策的决策树模型和神经网络模型。分析表明,两种模型的正确率均在80%~90%,且均具有良好的稳定性。这说明,机器人生态圈自主任务决策问题可以通过决策树、神经网络等机器学习方法来很好地加以解决,从而为面向无人化场景的任务应用提供技术支持。 相似文献
15.
16.
攻击线目标的末敏子母弹是一种新型弹种 ,具有较高的射击效力。在分析末敏子母弹抛撒和运动特性的基础上 ,提出近似模拟末敏子弹落点的方法 ,分析过程简单、快速 ,结果具有一定的可信性 ,为近似分析末敏子母弹武器系统射击效力提供了参考工具 相似文献
17.
多核系统中末级Cache是影响整体性能的关键。为了提出一种细粒度、低延迟、低代价的末级共享Cache资源管理机制,将系统性能目标转换为每个内核当前占用Cache资源的替换概率,以决定每个内核能够提供的被替换资源的数量;对某个需要增加Cache资源的内核,从可提供被替换资源的候选内核中选出距离较近且替换概率较高的一个内核,并以Cache块为粒度进行替换,从而实现Cache资源在不同内核间的动态划分。与传统以相联度为粒度的粗粒度替换机制相比,以Cache块为单位的替换机制具有更细的替换粒度,灵活性更高。另外,通过将位置信息和替换概率结合,保证了Cache资源与相应内核在物理布局上的收敛,降低了访问延迟。同时,所提出的方法只需要增加极少的硬件代价。实验结果表明,根据实验场景和对比对象的不同,所提方法与其他已有研究成果相比,可以实现从6.8%到22.7%的性能提升。 相似文献
18.
一种新的基本概率函数构建方法及应用 总被引:1,自引:0,他引:1
针对Dempster-Shafer(D-S)证据推理中基本概率赋值函数的构造问题,基于模糊聚类分析给出了一种新的构建方法.将它应用到雷达目标识别的仿真实验中,并与灰关联法相比较,结果表明该方法切实可行,不仅提高了基本概率赋值的准确性和稳定性,而且利用了数据的结构信息,有效缓解了证据的冲突. 相似文献
19.
为了在分离模块航天器研制过程中充分考虑各类不确定性因素的影响,以此对全寿命周期成本、收益以及系统稳健性和灵活性进行综合评价和设计优化,本文对新概念航天器——分离模块航天器概念设计阶段的不确定性多学科设计优化(UMDO)进行了研究.首先,对UMDO方法进行了概述,对分离模块航天器UMDO的主要流程进行了介绍.其次,对分离... 相似文献
20.
矩阵转置是矩阵运算的基本操作,广泛应用于信号处理、科学计算以及深度学习等各种领域。随着国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)在各种领域中的推广应用,对高性能矩阵转置实现提出了强烈需求。针对飞腾异构多核DSP的体系结构特征与矩阵转置操作的特点,提出了一种适配不同数据位宽(8 B、4 B以及2 B)矩阵的并行矩阵转置算法ftmMT。该算法基于DSP中向量处理单元的Load/Store部件实现了向量化,同时基于矩阵分块实现了多个DSP核的并行处理,通过隐式乒乓设计实现了片上向量化转置与片外访存的重叠以及访存性能的大幅提升。实验结果表明,ftmMT能够显著加快矩阵转置操作,与CPU上的开源转置库HPTT相比,可获得高达8.99倍的性能加速。 相似文献